Instalación de las librerías necesarias para el proceso

Instalación del diccionario que contiene las palabras clasificadas según los sentimientos, esta parte es para evaluar el vocabulario empleado a los agentes

Las siguientes librerias son necesarias para estudiar las relaciones semánticas

Librerias necesarias para evaluar la experiencia general del cliente, no es necesario traducir el texto para este paso

Funciones globales para la limpieza de texto

Lectura del Dataframe

Creacion de variables para detectar atipicos

Funcion global para la frecuencia de las palabras y polaridad de sentimientos

PARA DETECTAR LAS EMOCIONES SIEMPRE SE DEBE CORRER LAS SIGUIENTES LINEAS:

LSTM FOR EMOTION EXTRACTION

En esta sección se explicará como se elaboró el modelo para la extracción de emociones de las conversaciones de los usuarios. Todos los dataset empleados están en inglés. El modelo puede elaborarse o modificarse si se logra encontrar un dataset con la clasificación de las emociones en español. También podemos mejorar el modelo corriendo con emmbedings entrenados, como word2vec u otros. El modelo ya se encuentra guardado y puede ser empleado en cualquier momento, sin embargo, si se quiere modificar el modelo, algún parámetros se iene que volver a correr y guardarlo en formato que tensor flow pueda reconocer después.

Carga de los datos para el train

Limpieza de los audios

En esta sección se realiza una limpieza general de los audios, eliminar stop words generales como nombres apellidos, números, preposiociones y demás.

Definicion Stop words_globales

Nombres

Definicion de las stop words generales

Limpieza general para agente y usuario

Dataframe usuario gráficas generales

Cantidad de llamadas analizadas por mes

Cantidad de llamadas analizadas por segmento

Limpieza general para el usuario

Observamos las palabras más frecuentes para eliminar stop-words que pueden ser propias del negocio, como en este caso Ecopetrol.

Procedemos a la eliminación de estas stop-words propias del negocio que no aportan valor.

Hasta la línea anterior termina la limpieza general del texto

Unimos el resultado de los dos pasos anteriores para poder realizar la nube de palabras

Guardado de la informacion limpia para el usuario, este paso es muy importante ya que define los dataframes con los que vamos a trabajar después.

Division del daframe Agente y usuario

Salud

Stop words salud

Patrones

TERMINOS CLAVE N-GRAMAS

TERMINOS CLAVE

MODELADO DE TOPICOS

SEMANTICA DE LAS PALBRAS

DETECCION DE LA TIPOLOGIA DE LAS PALABRAS EMPLEADAS POR LOS AGENTES

Deteccion Emociones

DETECCION DE EMOCIONES

Para la detección de emociones en el texto, debemos cargar el texto traducido al inglés. Se realia la aclaración de que el texto traducido debe ser el texto puro, con las stop-words y demás debido a que es necesario tener las frases completas para la clasificación.

Cargamos el modelo previamente entrenado para la obtención de las emociones

Calculamos los sentimientos para cada conversación, el resultado es un diccionario con los porcentajes asignados de cada emoción para el texto en particular.

Realizamos la creación de una lista que va almacenando los resultados por sentimiento de cada una de las conversaciones, esto lo hacemos para hacer una ponderación después y obtener resultados globales de las emociones de los usuarios.

Para poder hacer la gráfica de sentimientos en versión polar debemos estandarizar todos los valores y esto lo hacemos con la función de MinMaxScaler()

Analisis de sentimientos

Colocaciones

Usuarios

Agentes